GPT-5.5 发布,详细解读
GPT-5.5 发布,详细解读凌晨,OpenAI 发布 GPT-5.5,是 GPT-5 系列迄今最大更新
搜索
凌晨,OpenAI 发布 GPT-5.5,是 GPT-5 系列迄今最大更新
在嘈杂喧嚣的 AI 世界里,什么才是真正值得关注的?《麻省理工科技评论》的记者和编辑花了多年时间思考这个问题,追踪 AI 的进展,描绘下一步走向。现在,我们第一次把答案浓缩成了一份清单。
最近半年,几乎所有新出的漫剧 Agent 都在讲同一个故事: 一个人就能拍一部剧。 工具帮你搞定分镜,你只管想故事。 一个人 + 一个漫剧 Agent 就是 OPC,超级个体。
上周被李继刚老师邀请去做了场私享会,关于 AI 和组织的访谈。
强如谷歌,算力也不够了。
在游戏 NPC、虚拟主播、在线客服等数字人对话场景中,倾听时的 “扑克脸” 问题一直是行业长期痛点 —— 虚拟人说话时口型可以做到精准同步,但倾听时却表情僵硬、毫无反应,严重影响对话的自然感和沉浸感。盛大 AI 研究院(东京)与东京大学联合提出 UniLS(Unified Listening and Speaking),首个仅凭双轨音频即可端到端同时驱动说话和倾听面部动作的统一框架。
还记得两年前,AI 生视频可谓是「鬼畜专区」—— 人物多一根手指算基操,走路自带鬼步舞才是常态。结果转眼间,从 OpenAI 的 Sora 到字节跳动的 Seedance,这些模型已经开始一本正经地「模拟世界」了:水会流、球会弹、光影能追踪,俨然一副要当「物理引擎」的架势。
刚刚,混元的 Hy3 Preview 也正式亮相,这是腾讯首席 AI 科学家姚顺雨主导的一个模型。姚顺雨表示,Hy3 preview是混元大模型重建的第一步。他希望通过这次开源和发布,不断提升 Hy3 正式版的实用性,以及模型在真实场景中的综合表现,并开始探索特色模型能力。
Anthropic 在私募二级市场被追到接近 1 万亿美元,热度反超 OpenAI,背后是稀缺股权、收入增长、Claude Code 的产品势能,以及资本对 AI 平台入口的重新下注。
本文深度拆解 AI 笔记应用Coconote的创业与收购全历程:创始人 Brett Bauman、Zack Hargett 于 2023 年 4 月推出产品,零广告预算,靠一系列反常规决策,仅用两年实现670 万美元 ARR,最终被教育科技巨头 Quizlet 收购。